城市数据实践:基于百度热力图数据的中山市中心城区空间结构分析
前言:本期数据实践栏目,来自城市数据研习社社员梁家俊的实践案例,学号A499。作者参加了由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,以下为其参与数城工作营(点击查看)的研究成果。
基于百度热力图数据的
中山市中心城区空间结构分析
大家好,我叫梁家俊,是来自中山市规划设计院的“规划师新丁”。经过一年多的规划工作,真切地感受到了如今传统规划所面临的困境。“大数据”如同黑暗中众多亮光中最亮的一束,越来越受到规划界的重视。个人认为城市数据的引入对于规划学科与行业来说,是一种从“定性”到“定量”的跨越。借助全方位、高维度的数据采集以及后期的数据分析,城市问题可以被量化成具体的数据,也许可以让规划向“科学”迈进重要一步。
十月的普通一天,我加入了城市数据研习社。通俗易懂的课程让我这个数据小白迅速掌握了数据与GIS的基础知识,并在小智老师和大鹏老师的指导下,顺利地完成了工作营的作业。
一、百度热力图是什么?
百度热力图是百度在2011年新推出的一款大数据可视化产品。该产品是基于智能手机使用者访问百度产品 ( 如搜索、地图、天气和音乐等 ) 时所携带的位置信息,按照位置聚类,计算各个地区内聚类的人群密度和人流速度。计算结果用不同的颜色和亮度反映人流量的空间差异。
百度热力图可以反映一个时间点的人口集聚情况,也可以反映连续时间段的人口集聚程度变化和不同区域间的人口集聚程度变化,有很大的研究价值。热力图反映的是一个相对的人口集聚情况,不能反映真实的人口数量。
二、研究目的
基于百度热力图独有可以提取实时人口数据的特征,以中山市主城区为研究对象,通过中山市主城区不同时间和不同区域的人口热度变化,发现人口分布的规律。接着根据人在不不同时间点的空间位置规律来识别来识别城市商务办公中心、休闲娱乐中心、复合功能区等城市功能区。(比如人往往在工作日早上9-11点位于办公区域;在周末下午3-5点位于休闲娱乐区域;在晚上10点位于居住区域等)
三、研究对象与研究时间
研究对象:中山市中心城区,包括五区一镇以及五桂山镇一部分;
研究时间:选择工作日和周末两个时间段进行研究。每日的研究时间从早7点到晚23点。
四、研究思路
本次研究主要分为五步:
第一步:数据采集与数据清理,为后序研究做好准备;
第二步:研究工作日早7:00至晚23:00点中山市中心城区连续时间段的人口热度值变化,发现工作日什么时候人口热度比较大,什么区域人口热度比较大;
第三步:研究周末早7:00至晚23:00点中山市中心城区连续时间段的人口热度值变化,,发现周末什么时候人口热度比较大,什么区域人口热度比较大;
第四步:引入热度平均值和热度标准差两个指标,其中热度平均值来分析城市整体人口热度分布情况;热度标准差来分析不同时间段的人口热度变化程度,表征城市的功能复合程度。
第五步:根据工作日和周末人的生活工作习惯以及随之带来的空间位置的变化来分布识别城市商务办公中心、城市休闲娱乐中心、城市居住中心和功能混合最好的区域。
五、数据处理
本次研究采用的数据包括:①研习社提供的12月24日与12月26日两天共68张中心城区热力图(从7点到23点以半小时为频率);②从LSV软件下载的影像图数据(WGS1984坐标系);③与百度热力图同时下载的百度地图
首先,将带有WGS1984坐标系信息的中山市影像图以UTM49度带为投影基准进行栅格投影;而后将百度地图与影像图已经空间矫正;接着采用百度地图纠偏时保存的坐标信息文件将所有热力图进行矫正,此时热力图PNG数据已经带有正确的投影坐标信息。随后裁切中心城区范围以及提取其第四波段,得到本次研究所需的34张热力图PNG文件。
WEEKDAYS 工作日(以周一为例)不同时刻的热力图数据
WEEKDAYS 周末(以周六为例)不同时刻的热力图数据
六、工作日中山市不同时间点人口热度分析
(1)热力规律:
热力高峰出现在8点、11点、21—23点;热力低谷出现在下午16点。
由于百度热力图数据是基于百度系APP使用者的空间分布得来的,因此每个时间段热度值的高低只与使用百度系APP的人数多少有关。基于此设定,再加上个人平时观察到的人使用手机的习惯,来推测热度值变化的场景(此推测基于个人平日观察与猜想,与实际情况可能有出入,特此说明)。
(2)场景推测
a. 在工作日,公司往往早上9点开始上班。7点时大家一般还在睡觉,人口热度很低。8点多大家在上班出行的路上。上班的出行方式主要为小汽车和公共交通,其中中山的公共交通主要为公交汽车。在公共汽车上乘客有大量的时间看手机,使用百度系APP的人数相应增多;另外开车一族虽然不方便操作手机,但是有很大的可能使用百度地图进行导航。综合来看,容易出现人口热度高峰。
b. 早上9点到下午16点是大家上班时间,大部分使用电脑办公,使用手机APP的人数下降,相应的人口热度值下降。其中,中午11点出现一个小的热力高峰,应该是大家准备外出吃午饭,使用手机的机会上升;下午16点出现热力低谷,猜测大家可能是想着马上就要下班,要在下班前把事情做完,工作专注度比较高,使用手机的可能性下降;
c. 下午17点为下班高峰。在回家的路上,乘客使用手机的人数增多,人口热力相应增加;但是值并不是特别高,可能是因为大家的下班时间比较分散,存在加班现象;
d. 晚上18点到21点,有的人在加班工作,有的人在休闲娱乐,使用手机的人数综合看比较正常;
e. 晚上21点、22点和23点,大家躺在床上睡觉之前习惯性的玩手机,再次出现热力高峰。
七、工作日中山市不同区域人口热力分析
将热力图数据重分类为七类,类别越大,该区域集聚程度越高(图面表现为颜色越深)。本次研究将4、5类定义为次热力区,6、7类定义为高热力区。
a. 7点-9点是起床和上班时间,高热区仅有兼具员工住宿功能的火炬区科技园一处;次热区主要为利和广场周边居住区、电子科技大学宿舍区与顺景花园片区。可看出此时间段市民以居住区集聚为主。
b. 10点-12点与15-18点是工作时间,高热区有利和-京华片区、电子科技大学-溢彩荟片区、大信新都汇片区以及人民医院;次热区主要为火炬科技园片区、盛景尚峰片区、富业广场片区以及火炬科技园片区,此时间段以工作与医疗区域集聚为主。
c. 13点-14点是午休时间,热区有利和-京华片区、电子科技大学片区以及人民医院片区;次热区主要为张家边片区、兴中广场至旧城区片区以及盛景尚峰片区。可看出此时市民往往向周边休闲区域进行餐饮活动,并且在上班前回到工作区域。
d. 19点-23点是晚饭及休息时间。高热区有电子科技大学片区、广东理工学院片区与利和-京华片区;次热区主要为西区富华道片区、张家边片区与火炬逸景花园片区。集聚主要体现在居住片区,可看出工作日市民晚上娱乐活动不频繁,基本以回家休息结束一天的辛勤工作。
八、周末中山市不同时间点人口热力分析
(1)热力规律
在周末,中心城区热力度高峰出现在:13点、17—19点、22点。市民出行较为分散,午后逐渐聚集成高峰。
(2)场景推测
a. 一周的工作过后,周末早上市民往往睡懒觉,起床后的早上也以家里活动为主,手机用户比较少,相应的人口热度比较低;
b. 到了中午13点钟,市民开始出门吃饭,或是吃完饭出门。交通出行开始发生,使用手机的频率上升,相应的形成人口热力小高峰;
c. 下午14到16点,市民或是在家中休息,或是在外休闲娱乐,使用手机的频率不高,热力值相应下降。但这个时间段的热力值比上午热力值高,说明市民在下午的活跃度更高一些;
d. 晚上17到19点,市民出门准备吃晚饭,迎来新一轮交通出行,使用手机的频率上升,并形成了人口热度最高峰;
e. 20到21点市民回到家中休息或是在外休闲娱乐,使用手机的频率下降,热力值相应下降
f. 晚上22点大家躺在床上睡觉之前习惯性的玩手机,再次出现热力高峰。
九、周末中山市不同区域人口热力分析
与工作日相同,将热力图数据重分类为七类。类别越大,该区域集聚程度越高(图面表现为颜色越深)。本次研究将4、5类定义为次热力区,6、7类定义为高热力区。
a. 7点-10点的周末,高热区为广东理工大学职业学院、电子科技大学片区与张家边片区,次热区为中山路居住区片、火炬科技园以及博爱与悦来南路交界的居住区。可看出大部分市民都充分享受周末难得的懒觉时间。
b. 11点-14点,高热区为电子科技大学-溢彩荟片区、利和-京华片区与大信新都汇片区;次热区主要为兴中广场至富业广场连片、君汇湾附近商业区域以及顺景花园片区。可看出此时大部分市民开始进行出行休闲。
c. 15点-18点,从热力图中,可看出此时热力分布最为旺盛,市民到了下午时间纷纷出门。高次热区与上午大致相同,不过热度范围则大为增加。
d. 19点-20点与21-23点是周末的晚饭以及夜生活时间。高热区有利和-京华片区、兴中广场片区、电子科技大学片区与大信新都汇片区;次热区主要为张家边片区、西区富华道片区与峰华28片区。相比于工作日的晚上与周末的白天,峰华28、富华道片区等具有夜间休闲活动的区域热度也有所提高。
十、引入两个评价指标:热力平均值与热力标准差
为了后面的城市功能评价,引入两个新的评价指标:热力平均值与热力标准差。
热力平均值表征一个区域整体的热度水平。平均值越高,说明区域的整体热度越大,分布的人口越多,反之则人口越少。比如城市中心区往往热力平均值较高,郊区热力平均值较低。
热力标准差表征一个区域不同时段的人口热度变化程度。标准差越低,表明区域不同时间的人口热度变化越小,人口热度变化越平缓。反之表明区域不同时间的人口热度变化越剧烈。热力标准差是评价区域功能复合的重要标准,城市单一功能区如城市商务中心、城市休闲中心往往工作时间段人口聚集,但到了晚上人去楼空,人口热度变化较大,标准差相应较大;城市混合功能区城市功能混合,工作时间和休息时间均有人口分布,人口热度变化较小,标准差相应较小。
十一、基于热力平均值和热力标准差的中山市城市功能评价:
综合周末与工作日两天样本数据,利用热力平均值因子,可识别出平均高的区域为城市热力核心区;利用热力标准差因子,可识别出标准差高的区域为城市单一功能区;标准差低的区域为城市复合功能区。
经过识别后,可得出以下结果:
(1)城市热力核心区为京华-利和片区、电子科技大学片区、大信新都汇片区、火炬区科技园片区 、张家边片区、沙边市场、假日广场区域、富业广场区域、中山市汽车总站片区。
(2)城市混合功能区为电子科技大学片区、大信新都汇片区、火炬区科技园片区 、张家边片区4个区域。这4个区域为目前中山市居住、休闲、工作多功能混合最为成熟的区域。
(3)城市单一功能区为利和-京华片区、天悦城片区、兴中广场片区、中医院、大信海岸家园、大信芊翠家园、假日广场片区、人民医院、映翠豪庭、博爱医院、大东裕办公区、盛景尚峰、奕翠园、远洋广场、白沙湾市场片区、凯茵新城、沙边市场片区、太阳城广场、火炬城东汽车站。
十二、中山市中心城区城市功能区详细识别:
结合特定时段的热力值与标准差值,可识别出更为详细的城市功能区。
(1)单一功能区的详细识别
a. 城市商务办公区识别:工作日10点和15点的人口热度值最高同时全天高标准差的区域
经过识别,其中特征最为明显的有五片区域,分别是利和-京华片区、大信新都汇、大东裕办公区、盛景尚峰、火炬区科技园。除火炬区科技园外,其余均为传统的写字楼商务办公区。这几个办公区域在中心城区已初步形成规模。
b. 城市居住区识别:工作日和周末早上7点和晚上22点的人口热度值高同时全天高标准差的区域。
经过识别,其中特征最为明显的有东区奕翠园、恒大绿洲区域、时代云图、大信海岸家园、白沙湾市场区域以及沙边市场区域。其中,奕翠园、恒大绿洲、时代云图、大信海岸家园均为商品房类的居住小区;而白沙湾及沙边市场区域则以旧型公寓以及旅馆招待所为主。
c. 城市休闲区识别:周末15点和晚上20点的人口分布热度高及高标准差的区域。
经过识别,其中特征最为明显的有利和-京华片区、大信新都汇、兴中广场片区、天悦城广场、远洋广场、富业广场、太阳城广场。利和-京华片区、大信新都汇、富业广场、兴中广场均为传统商圈区域,区位优势明显。而近年新建成的天悦城、太阳城广场、远洋广场等新商圈虽初具规模,但综合热度较传统商圈还是略微逊色。
(2)复合功能区的详细识别
主要为工作日和周末日平均热力值高及标准差较低的区域。与十一小节相同,经过识别,其中特征最为明显的有电子科技大学-溢彩荟片区、大信新都汇片区、火炬区科技园片区、张家边片区。其中,大信新都汇片区与张家边片区周边都为传统居住区,目前已形成成熟的城市功能复合区;而电子科技大学为学校带动区域发展的典型区域,目前已逐渐成为良好的复合功能区;火炬区科技园则是园区带动区域发展的类型,虽然已处于近郊地带,但周边功能配套齐全,形成小有规模的复合功能区。
十三、工作营总结
首先,感谢小智老师悉心的课后辅导,大鹏老师和颖子老师的深入浅出的课程以及晓生和冯臻两个小伙伴能平时和我一起研究,让我这个数据小白这次做了一份让自己比较满意的作业。
由于研究时间所限,这次研究还有一些不严谨的地方。比如,每天的热力情况虽然近似但却不尽不同,工作日和周末只选取一天的样本显得太少,特别是周末的样本恰逢圣诞佳节,对研究结果也肯定有所影响;人口聚集程度仅仅是城市研究的一个因子,本次研究也只能从人口的聚集程度上对城市的功能进行识别和评价,未免不够全面。相信结合其他路况、城市poi等其他因子会让结果更为令人信服等等。
不过通过这次作业,加深了我对城市动态数据的了解,也加快了我掌握arcgis分析的脚步,收获和进步还是很大的。希望以后能继续努力,成为一名真正的数据达人。
作品成果:
认证证书:
梁家俊,已参加由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,具备城市数据综合分析能力,特此颁发认证,以资鼓励。
证书查询网址:www.caup.net/cert
往期回顾:
城市数据研习社是国匠城、城市数据团共同举办的持续性学习组织,社员将享受到持续更新的数据课程,免费使用的数据插件,以及社群内的交流答疑。
目前,城市数据研习社开启了“千人计划”,希望能够从规划师中首先招募1000人,作为社群的中坚力量,助推规划师个人发展。
城市数据研习社咨询群:413942566
长按识别二维码,腾讯课堂
报名加入城市数据研习社